AI资讯新闻榜单内容搜索-Gemini

GPT-5编程测评大反转！表面不及格，实际63.1%的任务没交卷，全算上成绩比Claude高一倍

Scale AI的新软件工程基准SWE-BENCH PRO，出现反转！表面上看，“御三家”集体翻车，没一家的解决率超过25%： GPT-5、Claude Opus 4.1、Gemini 2.5分别以23.3%、22.7%、13.5%的解决率“荣”登前三。

来自主题: AI技术研报

11220 点击 2025-09-22 16:11

马斯克放出新模型Grok 4 Fast，1/25成本媲美Gemini 2.5 Pro

就在昨天深夜，马斯克的 xAI 悄无声息地扔出了一颗重磅炸弹——Grok 4 Fast！

来自主题: AI资讯

9382 点击 2025-09-22 11:47

刚刚，Gemini「灵魂人物」官宣加盟xAI！马斯克火速转推背书

Gemini核心开发者Dustin Tran昨日官宣跳槽xAI！马斯克也已转发推文确认。在谷歌的8年，从Gemini 1到最新尚未公布的Gemini，背后都有他的身影。他的到来，能为Grok带来哪些变化？

来自主题: AI资讯

8990 点击 2025-09-21 19:23

文心最新模型直接硬刚Gemini 2.5 pro & GPT5，真的这么神吗？

文心最近发布了两个模型ERNIE-4.5-21B-A3B-Thinking和X1.1 在海外开发者社群中讨论很火爆甚至有老外称这是ta 认为的最强中国模型。真的这么神吗？饼干哥哥做了一波实测案例，

来自主题: AI技术研报

8853 点击 2025-09-20 09:42

刚刚，Gemini Chrome正式发布了！

当地时间9月19日，上午6:02分，Google Gemini App宣布 Gemini Chrome正式面向美国所有符合条件的 Mac和 Windows用户推出，并其即将在手机端 iOS上推出。

来自主题: AI资讯

11534 点击 2025-09-19 12:04

ICPC总决赛被AI统治！GPT-5组合系统12题全对登顶，人类打破头只能争夺第三

在刚刚结束的2025年国际大学程序设计竞赛（ICPC）世界总决赛上，OpenAI的系统完美解决全部12道题目，若计入排名将位居第一。谷歌的Gemini 2.5 Deep Think模型解决10道题目，达到金牌水准名列第二。

来自主题: AI资讯

8969 点击 2025-09-19 09:24

腾讯AI Lab首创RL框架Parallel-R1，教大模型学会「并行思维」

自从 Google Gemini 将数学奥赛的成功部分归功于「并行思维」后，如何让大模型掌握这种并行探索多种推理路径的能力，成为了学界关注的焦点。

来自主题: AI技术研报

9121 点击 2025-09-18 15:04

谷歌的香蕉和字节的梦，相逢在 Lovart 的无限画布上

谷歌这只「香蕉」火得有些疯狂：Nano Banana（即 Gemini 2.5 Flash Image）自 8 月底上线以来，仅用几周就吸引了超过 1,000 万新用户，并在 Gemini 应用中完成了 2 亿次图像编辑请求

来自主题: AI产品测评

9993 点击 2025-09-16 09:58

全网都在玩的生图模型，我用它把 iPhone 17 提前发布了

最近，朋友圈和抖音小红书几乎被 Nano Banana 刷屏了。这个香蕉模型似乎要让 P 图这个词消失，直接给 Gemini 带来了一千万的新用户，火得一塌糊涂。

来自主题: AI资讯

7610 点击 2025-09-10 10:46

6000字复盘：Google AI变猛记——从 Nano Banna、Genie 3、Veo 3到Gemini 2.5的绝地反击

一年前，Google 在 AI 赛道上还是「追赶者」的形象。ChatGPT 席卷硅谷时，它显得迟缓。但短短几个月后，情况突变。 Gemini 2.5 Pro 横扫各大榜单，「香蕉」模型 Nano Banana 让生图、修图成了轻松事；视频模型 Veo 3 展示了物理世界的理解力；Genie 3 甚至能一句话生成一个虚拟世界。

来自主题: AI资讯

10017 点击 2025-09-04 12:35